检索结果

Select

1. 基于分层Option的仿人机器人相似性关键姿势转换

柯文德彭志平陈珂项顺伯

计算机应用 2013, 33 (05): 1301-1304. DOI: 10.3724/SP.J.1087.2013.01301

摘要（806）

PDF （630KB）（572）

针对运动捕获系统获取的人体运动轨迹固定、难以实现仿人机器人关键姿势转换问题，提出了一种基于分层Option学习的仿人机器人关键姿势相似性转换方法。构建多级关键姿势树状结构，从关节相似差异、时刻整体相似差异、周期整体相似差异等角度描述了关键姿势差异，引入分层强化Option学习方法，建立关键姿势与Option行为集，由关键姿势差异的累计奖励将SMDP-Q方法逼近最优Option值函数，实现了关键姿势的转换。实验验证了方法的有效性。

参考文献 | 相关文章 | 多维度评价

Select

2. 新的多移动机器人任务协商模型

柯文德彭志平陈珂蔡则苏

计算机应用 2013, 33 (02): 346-349. DOI: 10.3724/SP.J.1087.2013.00346

摘要（796）

PDF （635KB）（379）

针对多机器人协商中缺少心智状态与实际任务执行能力、通信带宽拥挤导致的低实时性以及从协商历史中缺乏快速学习等问题，提出一种多移动机器人任务协商模型。首先，阐述了机器人基本运动形态;其次，为多机器人协商定义了基于π演算的心智状态(信念、目标、意图、知识更新等)与能力状态(协作、能力判断、任务分配等);再次，构建了多机器人协商模型，研究了协商周期、协商任务、协商效用估计、协商分配协议、学习机制等。最后在机器人足球比赛平台上验证了方法的有效性。

相关文章 | 多维度评价

Select

3. 基于π演算的足球机器人协作Q学习方法

柯文德朴松昊彭志平蔡则苏苑全德

计算机应用 2011, 31 (03): 654-656. DOI: 10.3724/SP.J.1087.2011.00654

摘要（1553）

PDF （603KB）（991）

针对多机器人协作学习时出现的学习速度慢、学习效率低等问题，提出了一种基于π演算心智模型的足球机器人协作Q学习方法，描述了机器人的运动模型，定义了球场现状、目标、意图、行为、协作、请求、扩展知识、能力判断和联合意图等机器人心智状态，构造了联合奖励函数。最后通过实验验证了方法的有效性。